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1. Introdução-fábula 


“Dados, dados por toda a parte, 
mas nenhum pensamento para pensar!” 
Jesse H. Shera 


Manhã de segunda-feira, 23 de junho. 


Estávamos nós (pós-graduandos do Departamento de Informática em Saúde da 
Universidade Federal de São Paulo) reunidos no anfiteatro José C. de Figueiredo para o 
segundo e último seminário sobre o Capítulo 2 do livro Medical Informatics: computer 
applications in health care and biomedicine (Shortliffe & Perreault, 2000), intitulado 
Medical Data: their acquisition, storage and use. O objetivo do seminário era, obviamente, 
discutir a questão dos dados médicos enquanto objeto de estudo da informática médica. 


Apresentação finda, discussão iniciada e eis que retorna triunfante, qual Fênix, a pergunta: 
“Mas o que é dado? O que é dado?!” 


A pergunta, repetida à exaustão durante o primeiro seminário há uma semana, regressava 
agora mais desafiadora e aterrorizante do que nunca, pois ficara sem resposta na época e, ao 
que tudo indicava, ficaria sem resposta agora também. 


Cada vez que a pergunta ecoava nas paredes da sala sentíamos sua materialização em 
espectro fantasmagórico a pairar sobre nossas cabeças e a nos amedrontar com sua voz 
grave, arrogante, cínica e com o trêmulo característico das vozes espectrais: “Vamos! 
Respondam-me, alunos. Eu vos desafio! O que é dado? O que é dado!?” 


Os esforços dos mais corajosos foram em vão. A segunda batalha entre os alunos e a 
pergunta espectral parecia que seria vencida novamente pela pergunta (o que, diga-se de 
passagem, não necessariamente é ruim). 


Mas por sorte fomos poupados da humilhação da segunda derrota pela badalada das onze 
horas que determinava, imediatamente, o cessar das hostilidades já que um novo seminário 
estava por vir. 


Respiramos aliviados quando a pergunta espectral, tão rápida quanto surgiu, desapareceu 
sem deixar vestígios aparentes. Houve até quem desdenhasse: “Que pergunta chata e sem 
propósito! Não larga do nosso pé. Até parece que é importante...” E assim cada um seguiu 
seu rumo. 


Entretanto, em breve eu descobriria que o espectro ainda estava por perto, mais perto do 
que jamais poderia imaginar... 


Na tarde daquele mesmo dia fui ao banco, caminhando, mas com uma estranha sensação: 
“alguém está me seguindo”. Bruscamente voltava-me para trás e, claro!, não havia 
ninguém. Mas a sensação de que alguém ou, já temendo o pior, alguma coisa, me vigiava, 
continuava. 


Após breve conversa com o gerente, ele solicitou: “Por favor, anote seus dados neste 
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formulário”. Pronto! Foi o bastante! O espectro surgiu novamente, bem à minha frente, 

aterrorizando: “O que é dado? Vocês discutiram sobre os usos, captação e tipos dos dados 


médicos, mas não conseguem responder a pergunta básica: O que é dado? O que é 
dado!?” 


E a assombração não parou por aí. Em diversas outras ocasiões, no mesmo dia, ela surgiu. 
Nos Correios, na loja de presentes e até na padaria. Pensei: “Se essa pergunta me 
acompanha até nos dados do dia-a-dia, o que fará quando eu tentar trabalhar diretamente 
com os dados médicos em minha tese? Que ardil esse espectro utilizará para burlar minha 
vontade de usar os dados sem antes definir o que é dado em si?” 


Concluí que deveria exorcismar de vez essa pergunta e fazer com que esse espectro não me 
incomode tão cedo. Muni-me com armas adequadas (livros, pois estacas de madeira e balas 
de prata não teriam qualquer efeito nesse caso) e parti para o ataque: “Você quer saber o 
que é dado” Pois bem, aqui vai minha melhor resposta!!” 


E este é o objetivo deste texto: procurar uma resposta à pergunta “O que é dado?”. Tenho 


certeza de que não vou encontrar “a” resposta, mas pelo menos tentarei chegar um pouco 
mais perto dela, o suficiente para saber o que falar quando a pergunta espectral reaparecer. 


Uma última observação: esse assunto poderia render outra tese de doutorado, mas minha 
preguiça e incapacidade limitam meu esforço a apenas uma, a que já estou trabalhando. 
Desculpem-me portanto, leitores, pela pressa em terminar, pela maneira tipo “check list” de 
escrever da “Seção 3”, e pelo viés da literatura consultada (foram apenas alguns dos livros 
de minha biblioteca particular, e não os livros a que teria acesso em uma grande biblioteca). 


2. Método de trabalho 


O método utilizado neste trabalho foi a revisão e apresentação do conceito de “dado” (e 
demais conceitos relacionados, como “informação” e “conhecimento” de vários autores, 
procurando, ao final, sumarizar as diversas opiniões e chegar a um termo comum para a 
definição de “dado”. 


3. Revisão da literatura 


Dividi as referências consultadas, para facilitar a apresentação dos conceitos, nas seguintes 
categorias: 
e Referências gerais: compreendendo dicionários. 
e Referências de informática em saúde: compreendendo diversos textos, monografias 
e livros que tratam, primordialmente, da temática da informática em saúde. 
e Referências de estatística: compreendendo obras de caráter estatístico; 
e Referências de epidemiologia: textos primordialmente da área da epidemiologia 
(englobando a epidemiologia clássica e suas diversas variantes). 
e Referências de informática: compreendendo algumas obras sobre bancos de dados. 


3.1. Referências gerais 


O Dicionário Aurélio (Ferreira, 1986) identifica quatro sentidos globais para a palavra 
“dado”: 

e Peça cúbica, com faces numeradas de 1 a 6, usada em jogos. 

e Parte superior de pedestal, sobre a qual assenta a base da coluna; Plinto ou cubo que 
serve de base para um ornato qualquer; ou Dormente de pedra. 

e Datado. 

e Como derivado do latim datu, particípio passado de dare (dar), podendo ter 
múltiplas significações caso seja um adjetivo, pronome indefinido ou substantivo 
masculino. O “dado” substantivo masculino, objetivo de estudo do presente texto, é 
identificado como: a) Elemento ou quantidade conhecida, que serve de base à 
resolução de um problema; b) Princípio em que assenta uma discussão; Elemento ou 
base para a formação dum juízo; c) O que se apresenta à consciência como 
imediato, não construído ou não elaborado. 


Em língua inglesa, o Oxford Dictionary (Hornby, 2000) diz que “data”, o plural de 
“datum”, pode significar: 
e Facts or information, especially when examined and used to find out things or to 
make decisions. 
e Information that is stored by a computer. 


Da leitura do Aurélio (o Oxford não foi de grande ajuda) resulta que “dado” é um elemento 
conhecido. Mas o que é esse elemento? E de onde esse elemento surge? Como eu consigo 
esse elemento? 


3.2. Referências de informática em saúde 
Moraes (1994) conceitua dado e informação, diferenciando-os entre si, da seguinte 
maneira: 
e Dado é “uma descrição limitada do real, desvinculada de um referencial explicativo 
e difícil de ser utilizada como informação, por ser ininteligível.” 


e Informação é “uma descrição mais completa do real associada a um referencial 
explicativo sistemático. [...] “A informação é uma representação simbólica de fatos 
ou idéias potencialmente capaz de alterar o estado de conhecimento de alguém” 
(Carvalho 1988)”. 


Em uma publicação antiga da Organização Mundial da Saúde (World Health Organization, 
1988), os dados são “a representation of facts, concepts or instructions in a formalized 
manner suitable for communication, interpretation, or processing by humans or by 
automatic means”. 


Já em uma publicação mais recente (Pan American Health Organization, 1999) são 
identificados e diferenciados três conceitos: dados, informação e conhecimento: 

e “Data are the raw items, such as a blood pressure reading, a temperature, the name 
of a pharmaceutical product, the date of a patient's hospital discharge. By 
themselves, data have no meaning; they are totally isolated facts.” 

e “Information is produced when data are grouped by a specified set of common 
factors. Thus an assembly of biometric facts [ou dados biométricos| becomes 
information about a patient”s vital signs [...].” 

e “Knowledge is created when information is put into an overall setting. For instance, 
it relates to the expected pattern of vital signs for a particular illness, the available 
pharmaceutical products and their known side effects, or the level of activity of a 
hospital as it relates to budget and catchment population.” 


A Pan American Health Organization (1999) enfatiza que a chave para a diferenciação 
entre dado, informação e conhecimento é o contexto: “information can be described as data 
put into a specific context, whilst knowledge is information put into a general context”. 


Carvalho & Eduardo (1998) não definem dado, mas dizem que informação é “o significado 
que o homem atritui a um determinado dado, por meio de convenções e representações”. 


Shortliffe (Shortliffe & Perreault, 2000; Shortliffe et al., 1990) considera que um dado 
médico é “any single observation of a patient”. 


Costa (2001), ao discutir o desenvolvimento de um prontuário eletrônico baseado no 
paradigma da engenharia de software, e Sabatino (1988), ao demonstrar como informatizar 
uma sala de parto, tratam da questão da importância, seleção e categorização dos dados, 
mas em momento algum tentam definir “dado” em si. De forma semelhante, no 7 Seminário 
Nacional de Informação e Saúde (Fundação Oswaldo Cruz, 2000), as discussões 
englobaram o uso e importância dos dados, e não o conceito de dado em si. 


Em um interessante artigo! voltado para os sistemas de informações em perinatologia, mas 
aplicável a qualquer outro ramo na área da saúde, Slagle (1999) discute a importância da 
coleta de dados, quais devem ser coletados, como deve ser feita a coleta e quais as 


' Disponível integralmente on-line, em formato PDF, no endereço: 
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informações possíveis de serem extraídas desses dados, mas não se importa com a definição 
mesma de “dado” (ou informação ou conhecimento). 


Diversas publicações (Simini, 1999; Diaz et al., 1994; Simini et al., 1994) sobre o Sistema 
Informático Perinatal (SIP), do Centro Latino-Americano de Perinatologia e 
Desenvolvimento Humano (CLAP) também demonstram a importância e o uso dos dados, 
mas não ingressam em discussões conceituais. 


3.3. Referências de estatística 


Todos os livros consultados, com duas exceções, não apresentaram discussões conceituais 
sobre “dado” em si. 


Os clássicos livros de Sir Ronald A. Fischer (Fisher, 1971; Fisher, 1970) não fazem 
nenhuma alusão sobre a natureza do “dado” em si, bem como o livro marco da “análise 
exploratória de dados” de Tukey (1977). Em um livro recente sobre análise exploratória de 
dados (Hoaglin et al., 2000), são feitas ainda menos considerações conceituais, em favor de 
abordagens mais práticas. 


Até mesmo em livros dirigidos aos iniciantes em estatística e bioestatística (Soares & 
Siqueira, 2002; Silva, 2001; Altman, 1997; Laurenti et al., 1985; Berquó et al., 1981), nos 
quais poderia se esperar uma maior discussão conceitual, não pude encontrar uma só linha 
dedicada à discussão de “o que é dado”. Encontram-se, com efeito, discussões em um nível 
superior: dados primários e dados secundários, dados brutos e dados trabalhados, dados da 
população e dados da amostra, levantamento de dados, e outros. 


Em literatura mais avançada, não destinada aos iniciantes, nenhuma consideração 
conceitual sobre “dado” é apresentada (Armitage et al., 2002; Zar, 1999; Korn & Graubard, 
1999; Levy & Lemeshow, 1999; Kleinbaum et al., 1998; Feinstein, 1996; Kish, 1995; 
Iglewicz & Hoaglin, 1993; , 1992; Siegel & Castellan Jr, 1988; Fleiss, 1981; Cochran, 
1977). A abordagem geral é como obter, como trabalhar e como interpretar os resultados 
obtidos com os dados. 


Triola (1999) diz (no glossário) que “dados são números ou informações que descrevem 
alguma característica”. 


Zar (1999) ainda associa, de passagem, “dado” com observações quantitativas: “Many 
investigations in the biological sciences are quantitative, with observations consisting of 
numerical facts called data. (One numerical fact is a datum).” Entretanto seu ponto de vista 
descarta totalmente os dados não-numéricos e qualitativos, abundantes em medicina e de 
importância indiscutível (Pereira, 2001). 


3.4. Referências de epidemiologia 


Da mesma forma que a literatura em estatística, a literatura consultada em epidemiologia 
também não se ocupou em discutir “dado” em si, mas sim a apresentar diversas maneiras de 
como obtê-los e analisá-los, como explorar as hipóteses epidemiológicas com bases nos 
dados e quais os procedimentos corretos de inferências a serem utilizados para cada tipo de 


dado. 


Não encontrei discussões sobre “dado” em si na literatura básica em epidemiologia 
(Medronho et al., 2002; Gordis, 2000; Rouquayrol & Almeida Filho, 1999; Jekel et al., 
1999; Pereira, 1995; Lilienfeld & Stolley, 1994; Hennekens & Burnig, 1987), nem na 
literatura avançada (Luiz & Struchiner, 2002; Babbie, 2001; Szklo & Nieto, 2000; Fabre et 
al., 1998; Rothman & Greenland, 1998; Kelsey et al., 1996; Miettinen, 1985; Kleinbaum et 
al., 1982; Abramson, 1974). 


Em uma monografia do Centers for Disease Control and Prevention, intitulada “From Data 
to Action” (Centers for Disease Control and Prevention, 1994) é discutido como, a partir 
dos dados, planejar ações de impacto positivo na saúde da população. Novamente, 
nenhuma preocupação conceitual sobre “dado” em si. 


A literatura da “epidemiologia clínica” e “medicina baseada em evidências” também não 
traz discussões conceituais sobre “dado” (Gomes, 2001; Sackett et al., 2000; Drummond & 
Eliézer, 1998; Sackett et al., 1997; Riegelman & Hirsch, 1996; Fletcher et al., 1996; Sackett 
et al., 1991). 


Somente Feinstein (1985), em seu magistral “Clinical Epidemiology: The Architecture of 
Clinical Research”, ao discutir sobre os processos de medição (measurement) em 
epidemiologia, dá uma pista sobre “o que é dado”. Cito Feinstein a seguir: 


“The act of obtaining data is often called measurement — a word that is 
ambiguous because it can refer to two different activities: mensuration and 
quantification.” 


“Mensuration is the process of acquiring raw data by converting an observed 
entity into a descriptive statement” Quantification is the process of 
collecting a group of descriptive statements and expressing them in a 
numerical summary.” 


“[...] Mensuration thus refers to the act of collecting the individual items of 
data for individual people; quantification refers to the act of collecting the 
individual data into groups and summarizing the contents of the collection.” 


“Both types of measurement produce the basic data used in research [...], 
but the activities of mensuration are exclusively phenomena of science, 
whereas the activities of quantification are both statistical and scientific. 
Mensuration is a scientific procedure that converts observed phenomena into 
the raw data for cach person. Quantification contains a statistical component, 


consisting of the numerical expressions used to summarize groups of data, 
and a scientific component, consisting of the decisions made about wich 
groups to collect and compare.” 


Essa passagem de Feinstein (1985) foi, para mim, reveladora. Voltarei a ela nas conclusões 
deste artigo. 


3.5. Referências de informática 


Dispondo ainda de alguns livros de informática, especificamente sobre bancos de dados, 
procurei buscar neles alguma definição para “dado”. 


Hernandez (1997) diz que “data are the values that are stored in the database. [...] On the 
surface, this data is meaningless. We cannot learn, simply by inspection, what *92883º 
represents.” O autor também nos dá sua visão para informação: “Information is data that 
has been processed in a way that makes it meaningful and therefore useful to the person 
working with or viewing it.” 


C. J. Date, em três excelentes publicações (Date, 2001; Date & Darwen, 2000; Date, 2000), 
reconhece que os “dados” são um dos quatro principais componentes de um “database 
system” (sendo os outros três: hardware, software e usuários), mas não tenta definir o que é 
dado em si. 


Date reconhece que “the word data derives from the Latin for “to give”; thus, data is really 
given facts, from which additional facts can be inferred. [...] A “given fact” in turn 
corresponds to what logicians call a true proposition (a proposition in logic is something 
that evaluates to either true or false, unequivocally).” O autor considera que “dado” é um 
“fato dado” e não entra mais em considerações conceituais. Entretanto, a partir dessa 
constatação, ele desenvolve toda uma discussão conceitual profunda para outros aspectos 
da teoria de bancos de dados: relações, domínios, tipos de dados e outros. 


A literatura consultada sobre o Oracle9i, que é considerado um dos melhores “relational 
database management system” da atualidade, está mais preocupada em aspectos práticos e 
computacionais, não em conceitos e definições (Loney & Koch, 2002; Abbey et al., 2002; 
Burleson, 2002; Loney & Theriault, 2002; Thomas & Bryla, 2002). A maior discussão 
conceitual sobre “dado” apresentada foi que “In any business, certain pieces of information 
about customers, products, prices, financial status, and so on must be saved. These pieces 
of information are called data.” 


4. Conclusões 


Após o trabalho de revisão bibliográfica e da sumarização dos conceitos dos diversos 
autores, pude chegar a duas conclusões, as quais apresento a seguir. 


4.1. Da irrelevância conceitual 
A conclusão primeira e óbvia que se pode depreender da revisão bibliográfica é que: 


E totalmente irrelevante, para atividades 
científicas ou não, definir o que é dado. 


Praticamente todos os tratados de estatística, epidemiologia e informática consultados 
? 

partem do pressuposto que “dado” é “dado” e, a partir de então, constroem definições e 

conceitos para entidades mais importantes e em nível superior. 


Ora, é mais importante definir os “tipos de dados” (numéricos, qualitativos, etc.) do que o 
dado em si. Da mesma forma, é mais importante saber como coletar corretamente os dados 
em um questionário epidemiológico; é mais importante definir o que é uma “relação” (no 
modelo relacional de dados); é mais importante determinar quais os procedimentos 
estatísticos corretos para cada tipo de dado; é mais importante saber como analisar os dados 
para tomar decisões. 


Somente uma minoria de autores tentou fornecer alguma definição para “dado” e muitas 
dessas definições foram en passant. Isto mostra que é mais importante discutir questões do 
tipo “o que fazer com os dados” do que questões conceituais sobre “dado” em si. 


4.2. Da definição de “dado” 


ç ÃO r 2 
Quanto à definição de “dado”, concluí que”: 


“Dado” é a sentença descritiva resultante 
de um processo de mensuração. 


Claramente esta definição está baseada nos escritos de Feinstein (1985) — ver seção 3.4 — 
e, mesmo criticável, foi a mais satisfatória que pude encontrar. Vou explicar e exemplificar 
a definição para torná-la mais compreensível a seguir. 


Feinstein (1985) diz que o processo de mensuração é uma atividade científica que converte 
um determinado fenômeno/objeto/entidade observado em uma sentença descritiva. 


? Mesmo consciente da irrelevância da definição, depois do árduo trabalho de revisão bibliográfica eu não 
poderia deixar de emitir minha conclusão sobre “o que é dado”. 


Por exemplo: um paciente em uma consulta clínica pode ter as seguintes características 
observadas e mensuradas: 

e Através de um instrumento podemos medir seu peso e registrá-lo como 84 Kg; 

e Perguntando sua data de nascimento podemos saber que tem 32 anos de idade; 

e No exame físico podemos ver que seu reflexo patelar está diminuído; 

e Ele pode se queixar de uma “dor no peito” e durante a anamnese observamos que a 
localização da dor é subesternal, provocada por exercícios moderados e aliviada 
pelo descanso; 

e Seu sexo, masculino, é evidente; 

e Em uma radiografia recente concluímos que a área cardíaca está levemente 
aumentada (ele poderia estar normal, levemente aumentada, moderadamente 
aumentada e grandemente aumentada); 

e Ele mesmo nos conta que é católico. 


Em cada item exemplificado acima temos um (ou mais) processo de mensuração e uma 
sentença descritiva que resultou desse processo de mensuração. 


No primeiro item, o processo de mensuração tinha como objeto o peso do paciente e 
resultou na sentença descritiva “84 Kg”. No segundo item o objeto de mensuração foi a 
idade do paciente, e o resultado da mensuração foi a sentença descritiva “32 anos”. 
Poderíamos construir a seguinte tabela: 


Objeto do processo de mensuração | Sentença descritiva resultante da mensuração 
Peso (em Kg) 84 

Idade (em anos) 32 

Sexo Masculino 

Religião Católica 

Condição do reflexo patelar Diminuído 

Localização da dor torácica Subesternal 

Estímulo que inicia a dor torácica Exercícios moderados 

Situação que alivia a dor torácica Repouso 

Área cardíaca aos Raios-X Levemente aumentada 


Note que o processo de mensuração observa uma caracterísitca/fenômeno e o converte, 
(através do uso ou não de instrumentos de mensuração — por exemplo, uma balança — 
e/ou através de métodos objetivos ou subjetivos), em uma sentença descritiva. Essa 
sentença descritiva é o que costumamos chamar de dado. 


Note também que o dado (a sentença descritiva) pode assumir diversas escalas de 
expressão: dimensional de razão (peso, idade), qualitativa (sexo, religião, localização da 
dor torácica), ordinal (condição do reflexo patelar, área cardíaca aos raios-x, estímulo que 
inicia a dor torácica), e outras. 


Em teoria, esses dados (essas sentenças descritivas) seriam o que se costuma chamar de 
“dados brutos” de um processo de mensuração. Obviamente, em algumas situações, chamar 
um dado de “bruto” ou não é um pouco difícil. Por exemplo: o peso de 84 Kg é certamente 
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um dado bruto, mas a área cardíaca levemente aumentada pode não ser: talvez o dado bruto 
seja uma mancha cardíaca de 18 cm aos raios-x e da interpretação desse dado é que resulta 
a sentença “área cardíaca aumentada”. Mas se um médico tendo como referencial apenas 
sua experiência subjetiva em observar os raios-x conclui que a área cardíaca está 
“levemente aumentada”, talvez isso possa ser considerado um dado bruto. 


Uma outra situação complexa é a mensuração de alguns sinais biológicos, como por 
exemplo um eletrocardiograma. O traçado eletrocardiográfico é o dado em si? Ou são os 
dados alguma interpretação desse traçado, como fregiiência cardíaca? 


De qualquer forma creio que, na maioria das situações, entender como dado a sentença 
descritiva resultante de um processo de mensuração é a melhor resposta à pergunta “o que é 
dado?” 
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